Home

Introdução

O Brasil é conhecido internacionalmente como país do futebol. E isso se dá por diversos fatores, como: Popularidade do esporte, conquistas esportivas da seleção nacional no contexto global etc. Com isso, o futebol brasileiro tem suas nuances amplamente discutidas, seja por torcedores ou analistas esportivos. Alguns destes pontos de discussões e crenças estão amplamente enraizado no imaginário popular brasileiro. Quem nunca ouviu “Quem não faz leva”? Ou ainda, “Virou um Fla-Flu”?

Observando as complexidades e nuances do futebol brasileiro representada em palavras anteriormente, surge em muitos a vontade de uma opinião mais qualitativa para certas questões do futebol. E, por isso, há uma motivação de um estudo mais aprofundando sobre as questões do futebol brasileiro, principalmente através de análises estatísticas. Para a melhor investigação deveremos nos ater a perguntas bem específicas e bem formuladas. Sabendo o caminho que queremos chegar, certamente teremos sucesso e assim alcançaremos as respostas matematicamente embasadas .

Este trabalho se propõe a duas questões básicas, são elas: Intervenção do público no campeonato de pontos corridos e influência do regulamento no campeonato de sistema eliminatório, também conhecido como mata-mata. Sempre existiu a percepção que a torcida move o time em campo, isso além do senso-comum foi escrito por cronistas nos mais variados lugares. Para Carlos Alberto Vieira, editor do LANCE!, “Dizer que a torcida do Flamengo carrega o time é chover no molhado. O que vimos nas três vitórias seguidas em casa foi prova do que acontece há décadas e sempre faz a diferença para o Rubro-Negro. Como o time vem conseguindo os resultados a tendência é que este apoio aumente ainda mais. Tivemos 40 mil contra o Atlético? Vá contabilizando 50 mil, 60 mil nas próximas rodadas pois o torcedor ganha gosto de saber que ele é realmente o 12º jogador”.

O sistema eliminatório é muito querido pelos brasileiros por diversos fatores, o principal deles é certamente a emoção gerada por partidas eliminatórias. O principal embate regulamentar é a discussão sobre os critérios desempates, principalmente o chamado “gol fora”. Joseph Blatter, o então presidente da FIFA, teceu críticas a este critério. Disse ele, “Na verdade, a regra do gol fora de casa favorece a equipe que joga fora no jogo de volta. Com o placar empatado, o time tem 30 minutos a mais que seu oponente para fazer o gol fora. Além disso, na primeira partida não há possibilidade de tempo extra. É hora de repensar esse sistema. O futebol progrediu desde os anos 60 e a regra do gol fora de casa pode não ser questionada. Mas esta regra faz algum sentido?”

Metodologia

Apresentado os temas e propostas, faz-se necessário a organização do processo estatístico para obtenção das respostas. A primeiro etapa é a obtenção e limpeza de dados. A coleta de dados fora feita parte manualmente (Através de pesquisas na web e obtenção em fontes primárias como a CBF), parte computacionalmente (Através da extensão do Chrome Data Mining); e ainda um dataset disponível no Kaggle com os resultados do Campeonato Brasileiro desde 2003. Para limpeza de dados utilizou-se através da linguagem R e o software Microsoft Excel. Para as análises foi-se necessário medidas estatísticas e a visualização dos dados obtidos. A publicação e formatação visual das apresentações utilizou-se do R markdown, R notebook e flexdashboard.

Autores: Pedro Henrique Ribeiro Alves e Rodolfo Bramont Eiriz de Souza | Orientação: Professor Cássio Almeida

Metodologia e Introdução

Campeonato Brasileiro

Row

Tabela de Dados Geral

O primeiro dilema advindo da relação entre presença dos torcedores no estádio e desempenho esportivo dos times é o “dilema do ovo e da galinha”. Ou seja, os times vão bem porque seus torcedores estão presentes ou torcedores estão presentes porque seus times estão indo bem? Inicialmente precisamos analisar a diferença esportiva entre mandantes e visitantes, ainda que exista um ruído matemático, pois são inúmeras as variáveis responsáveis pelo desempenho de um time de futebol.

Time 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
Botafogo 0 5541 14456 9539 17774 13268 16280 18728 13080 8522 12685 11362 0 7258 10193 11569 15921
Flamengo 9047 9707 13657 15711 39211 40694 40036 18945 16985 12250 23385 26411 30963 24542 14484 47139 55025
Fluminense 7057 7666 15355 11773 17071 17259 22042 22993 11569 12644 17637 18490 16351 9139 14450 14458 20209
Vasco 4933 4770 16938 13450 15143 13723 0 13697 13866 7559 17618 0 12875 0 15031 14880 20448
Corinthians 8541 13527 27319 15691 19978 0 20213 27446 29424 25222 24441 28960 34150 28764 40007 31367 32855
Palmeiras 0 12791 14085 12748 17586 16877 18425 10971 12586 11983 0 19755 29633 32471 29672 32356 27994
Ponte Preta 4953 3826 5807 5706 0 0 0 0 0 6238 6414 0 6225 5309 6083 0 0
Santos 7735 12870 9611 9699 8424 9803 9242 9200 8892 8101 10405 9243 8691 11225 11597 10575 10306
São Paulo 10960 8586 9805 22949 28622 21331 26305 14704 21485 24298 23115 28544 20562 22513 35227 34320 29431
Atlético MG 12970 10538 21725 0 23199 18638 38761 13447 14100 18274 11436 14132 23353 18510 13157 17177 15255
Cruzeiro 26109 6074 15753 15239 23504 24245 21973 16072 10377 11677 28911 29678 22077 20475 14547 13534 22438
Grêmio 10510 7432 0 25630 21937 31725 17776 20369 15809 23530 19764 21028 25249 20448 19730 22264 16647
Internacional 14937 9363 16237 22084 18335 18641 18323 16630 18188 9270 7234 22318 18979 25422 0 27701 19824
Juventude 4871 5038 5648 4009 6528 0 0 0 0 0 0 0 0 0 0 0 0
Bahia 13042 0 0 0 0 0 0 0 22741 18891 18449 12579 0 0 21540 19315 26338
Vitória 4918 6388 0 0 0 15774 13391 15849 0 0 14780 10267 0 14009 10911 9181 0
Ceará 0 0 0 0 0 0 0 23467 13449 0 0 0 0 0 0 28078 26011
Fortaleza 24351 0 23731 11786 0 0 0 0 0 0 0 0 0 0 0 0 32999
Sport 0 0 0 0 26070 21745 17896 0 0 17811 0 18220 15081 12823 12349 11428 0
Náutico 0 0 0 0 12912 14894 13863 0 0 12894 10262 0 0 0 0 0 0
Atlético PR 8984 12979 11620 10505 12508 17092 16280 16377 14115 0 8772 12237 16430 15889 13732 10570 15114
Coritiba 8515 7393 18688 0 0 19222 16817 0 17894 12568 14651 12329 14001 9893 14348 0 0
Paraná 4906 4047 11864 10557 8789 0 0 0 0 0 0 0 0 0 0 6222 0
Avaí 0 0 0 0 0 0 9983 8535 6784 0 0 0 8477 0 7568 0 7704
Chapecoense 0 0 0 0 0 0 0 0 0 0 0 10021 9072 7612 9670 9391 6003
Figueirense 10418 10465 9279 10703 8903 9106 0 0 11625 7999 0 8378 8696 6628 0 0 0
Atlético GO 0 0 0 0 0 0 0 6677 9497 5587 0 0 0 0 5046 0 0
Goiás 13104 9133 12980 10305 14051 8558 11944 7036 0 0 12680 6942 8028 0 0 0 13506

Série Temporal [Campeões]

Uma análise da série temporal abaixo demonstra todo tipo de time de campeão, time com pouca média de público, caso do Fluminense em 2012 com 12644, time com alta média de público, caso do Flamengo em 2019 com 55025. Isso demonstra que o maior fator de decisão do futebol ainda está dentro de campo, o time com melhor técnica e melhor disposição tática dentro do campo irá sobressair-se, principalmente em campeonato por pontos corridos, onde a regularidade é o fator mais importante para a conquista do campeonato.

Boxplot [Times]

Histograma [Comentário]

A análise dos histogramas, o que está abaixo e o que está na próxima chart, mostra-nos que há uma diferença favorável aos mandantes ainda que tenhamos um relativo equilíbrio no caso dos gols. Então o fator casa, presença majoritária de público, é necessariamente benéfica ao clube mandante. Isto mostra que a torcida faz diferença, mas não necessariamente que a quantidade de torcedores presente nos estádios afetaria o desempenho positivamente.

Comentário

Histograma [Mandante]

Histograma [Visitante]

Tabela [Visitante x Mandante]

A tabela abaixo mostra através de medidas estatísticas o que fora representado pelos gráficos de histogramas anteriores. Mas agora, além da medida de centralidade que representa significativamente nossos dados na questão de superioridade dos mandantes para com os visitantes. Temos um número de mais de o dobro de vitória por partes dos mandantes, que volta a corroborar sobre a importância de jogar perante sua torcida.

Media_Gols Vitorias
Visitante 1.052526 1872
Mandante 1.596801 4027

Tabela [Evento Aleatório do Vetor - Ano 2013]

Tabelas de Dados Gerais do Brasileirão [Visitante]

Média de Público Média de Gols Público Total Gols Totais
Dados do Brasileirão 10637.62 2.649326 5063505 21033

Análise por Clube [C. Brasileiro]

Campeonato Brasileiro [Análise]

Análise

Como parte da solução do dilema do ovo e da galinha aplicado aos times de futebol e seus torcedores, decidimos entender a dispersão entre resultados e público presente nos jogos. Utilizamos dois gráficos para isso, onde uma mostra a relação entre pontuação realizada na partida e público presente no estádio, e outro, a relação entre gols e público presente no estádio.

Enquanto os gráficos anteriormente citados buscam compreender a relação direta entre público e desempenho. O gráfico agora proposto busca entender a influência dos resultados no público dos próximos jogos. Com isso, fizemos uma taxa de apelo por jogo para cada público. A taxa é calculada pela soma entre o quociente dos gols mais pontos obtidos nos últimos três jogos divididos pelas respectivas médias aritméticas. Por exemplo, o jogo de hoje seria teria uma taxa de apelo calculada a partir dos três jogos anteriores.

Maiores torcidas do Brasil

Maiores torcidas do Brasil

O gráfico acima representa as maiores torcidas do campeonato brasileiro. E Isso é especialmente correlato com os resultados obtidos a partir das taxas de apelo e o público presente. Três entre os quatros maiores clubes do Brasil em torcida tem uma pequena correlação linear na questão de público e torcida. O que nos leva a crer que esses times crescem principalmente pela sua capacidade de expansão em questão de torcida e presença de torcida.

Diante dos gráficos, medidas e microdados, não resta dúvida que a torcida é especialmente importante. Ela influencia o jogo, mas está longe de ser o principal fator. Times mais técnicos independentemente de torcidas serão superiores aos seus rivais. E o regulamento equilibrado de um campeonato de pontos corridos que equaliza a quantidade de jogos fora e casa, e ainda, a extensão do calendário que prioriza a regularidade, mostra-nos que apesar da influência da torcida, o fator decisivo é o próprio futebol praticado pelos times.

Análise

Example Botafogo

Example Flamengo

Example Fluminense

Example Vasco

Example Corinthians

Example Palmeiras

Example Ponte Preta

Example Santos

Example São Paulo

Example Atlético-MG

Example Cruzeiro

Example Grêmio

Example Internacional

Example Bahia

Example Vitória

Example Ceará

Example Fortaleza

Example Sport

Example Náutico

Example Athlético

Example Coritiba

Example Paraná

Example Avaí

Example Chapecoense

Example Atlético-GO

Example Goiás

Copa do Brasil

Row

Copa do Brasil [Análise]

Análise

Como já apresentado, faremos uma breve análise sobre os impactos das mudanças do regulamento referentes à Copa do Brasil de futebol. Com isso, primeiramente devemos apontar e procurar entender como se deram essas mudanças e com qual objetivo foram impostas pela Confederação Brasileira de Futebol (CBF).

No que se refere às mudanças relacionadas às fases 1 e 2, ocorreram em 2016, sendo na prática a primeira edição em 2017, e se mantém até os dias de hoje. Segundo o órgão organizador, a mudança foi feita para diminuir datas em virtude do extenso calendário do futebol brasileiro e também aumentar os atrativos da primeira e segunda fase, já que há um risco maior para os clubes considerados favoritos. Vejamos:

Regulamento Copa do Brasil

Regulamento Copa do Brasil

Em virtude disso, surge a dúvida: Os clubes de menor prestígio foram privilegiados? Para tal análise, consideramos os confrontos das vinte equipes melhor ranqueadas no Ranking Nacional de Clubes da CBF nos anos de 2014 a 2019 com o objetivo de inferir sobre os resultados das equipes “grandes” dentro da competição.

Além das já apontadas, houve outra considerável variante em torno do regimento da competição, a queda do gol fora como critério de desempate em todas as fases. Nos jogos de ida e volta, caso haja empate entre os adversários em pontos e saldo de gols, avança de fase a equipe que marcar mais gols como visitante - o chamado gol qualificado.

Um dos objetivos da regra, a princípio, seria fazer com que o time visitante buscasse o gol, tornando o confronto mais dinâmico, e não se “contentar” com um empate na tentativa de decidir em casa. A Copa do Brasil utilizou o gol fora como critério de desempate por muito tempo, até 2017. A partir de 2018 - primeira edição sem o gol qualificado - segue a atual regra. Ou seja, caso duas equipes empatam em número de pontos e saldo de gols, o classificado será decidido nos pênaltis.

Tal mudança pode ter influenciado na maneira dos clubes jogarem e consequentemente no número de gols na competição. Por conseguinte, analisaremos se as equipes tendem a buscar mais o resultado, ou seja, fazer mais gols quando há gol qualificado como um critério de desempate para a classificação. Em contrapartida espera-se uma retração no número de gols no atual sistema de disputa.

Assim sendo, consideramos para análise as edições de 2016, 2017, 2018, e 2019, sendo respectivamente duas a duas com a regra do gol qualificado e sem.

A fim de observar se tal mudança surtiu esse efeito, selecionamos os confrontos da terceira fase até as semifinais - finais não foram consideradas, pois a regra do gol qualificado já havia sido abolida - e fora analisada a frequência de gols em cada jogo.

Conclusão

De fato a mudança do regulamento nas fase 1 e 2 ocasionaram num maior equilíbrio entre as equipes consideradas grandes e equipes pequenas.

Observamos uma queda de 20% no percentual de classificação dos clubes de grande porte do futebol brasileiro. Com isso, podemos afirmar que o mando de campo, é sim um fator importante para determinar o resultado de uma partida.

As frequências absolutas de gols foram as seguintes: 2016 e 2017: 252 2018 e 2019: 226

As médias de gols foram as seguintes: 2016 e 2017: 2,333 2018 e 2019: 1,948

O que representa uma queda de aproximadamente 15% na média de gols.

Para tal efeito utilizamos o teste t-Student para verificar se realmente há uma diferença estatística. Com isso encontramos um p-valor de aproximadamente 2,3%. É claro que existem outros fatores que influenciam na queda da médias de gols, porém é muito difícil afirmar que isso se deu devido a extinção da regra do gol qualificado.

Análise

Número de gols Copa do Brasil 2016 - 2019

Copa do Brasil 2016 - 2019: Resultados recorrentes [Absoluto]

Copa do Brasil 2016 - 2019: Resultados recorrentes
Jogo 1 - 2016/2017 Jogo 1 - 2018/2019 Jogo 2 - 2016/2017 Jogo 2 - 2018/2019 resultados
8 11 6 4 0x0
8 7 9 6 1x1
1 1 3 3 2x2
1 0 0 1 3x3
6 9 11 10 1x0
2 6 3 8 2x0
3 3 5 5 3x0
2 2 0 0 4x0
0 0 1 0 5x0
6 3 3 6 2x1
4 1 0 2 3x1
0 0 1 0 4x1
0 1 0 0 5x1
1 2 1 0 3x2
0 0 2 0 4x2
1 8 2 7 0x1
5 2 2 2 0x2
1 0 0 1 0x3
3 3 3 5 1x2
1 1 1 0 1x3
1 0 0 0 2x3
0 0 2 0 1x4
1 0 0 0 2x5
a Considerando confrontos a partir da fase 3

Copa do Brasil 2016 - 2019: Resultados recorrentes [Relativo]

Copa do Brasil 2016 - 2019: Resultados recorrentes
Jogo 1 - 2016/2017 Jogo 1 - 2018/2019 Jogo 2 - 2016/2017 Jogo 2 - 2018/2019 resultados
0.145 0.183 0.109 0.067 0x0
0.145 0.117 0.164 0.100 1x1
0.018 0.017 0.055 0.050 2x2
0.018 0.000 0.000 0.017 3x3
0.109 0.150 0.200 0.167 1x0
0.036 0.100 0.055 0.133 2x0
0.055 0.050 0.091 0.083 3x0
0.036 0.033 0.000 0.000 4x0
0.000 0.000 0.018 0.000 5x0
0.109 0.050 0.055 0.100 2x1
0.073 0.017 0.000 0.033 3x1
0.000 0.000 0.018 0.000 4x1
0.000 0.017 0.000 0.000 5x1
0.018 0.033 0.018 0.000 3x2
0.000 0.000 0.036 0.000 4x2
0.018 0.133 0.036 0.117 0x1
0.091 0.033 0.036 0.033 0x2
0.018 0.000 0.000 0.017 0x3
0.055 0.050 0.055 0.083 1x2
0.018 0.017 0.018 0.000 1x3
0.018 0.000 0.000 0.000 2x3
0.000 0.000 0.036 0.000 1x4
0.018 0.000 0.000 0.000 2x5
a Considerando confrontos a partir da fase 3

Copa do Brasil 2016 - 2019: Resultados recorrentes [Absoluto]

Copa do Brasil 2016 - 2019: Resultados recorrentes
Jogo 1 Jogo 2 resultados
19 10 0x0
15 15 1x1
2 6 2x2
1 1 3x3
15 21 1x0
8 11 2x0
6 10 3x0
4 0 4x0
0 1 5x0
9 9 2x1
5 2 3x1
0 1 4x1
1 0 5x1
3 1 3x2
0 2 4x2
9 9 0x1
7 4 0x2
1 1 0x3
6 8 1x2
2 1 1x3
1 0 2x3
0 2 1x4
1 0 2x5
a Considerando confrontos a partir da fase 3

Copa do Brasil 2016 - 2019: Resultados recorrentes [Relativo]

Copa do Brasil 2016 - 2019: Resultados recorrentes
Jogo 1 Jogo 2 resultados
0.165 0.087 0x0
0.130 0.130 1x1
0.017 0.052 2x2
0.009 0.009 3x3
0.130 0.183 1x0
0.070 0.096 2x0
0.052 0.087 3x0
0.035 0.000 4x0
0.000 0.009 5x0
0.078 0.078 2x1
0.043 0.017 3x1
0.000 0.009 4x1
0.009 0.000 5x1
0.026 0.009 3x2
0.000 0.017 4x2
0.078 0.078 0x1
0.061 0.035 0x2
0.009 0.009 0x3
0.052 0.070 1x2
0.017 0.009 1x3
0.009 0.000 2x3
0.000 0.017 1x4
0.009 0.000 2x5
a Considerando confrontos a partir da fase 3

Desempenho dos 20 grandes na Copa do Brasil

2014 - 2016
2017 - 2019
Chave Freq. Absoluta Freq. Relativa Freq. absoluta Freq. relativa
Fase 1 34 0.809 21 0.618
Fase 2 23 0.852 21 0.7
Total 57 0.826 42 0.646
a RNC - Top 20: Clubes classificados

Classificação dado a vitória no primeiro jogo

Resultado da final dado primeiro jogo